其他
看看人家那智能在线爬虫系统,那叫一个优雅(附源码)!
编辑:乐乐 | 来自:GitHub猿 整理
上一篇:CSV是存储数据的最常用方法
大家好,我是Python人工智能技术
今天,推荐一个在线爬虫系统项目。猿哥第一次使用就有点上头,爱不释手,必须要推荐给大家。上次是谁要的智能在线爬虫系统项目啊,猿哥帮你找到了。
这是我目前见过的智能在线爬虫系统项目。功能完整,代码结构清晰。值得推荐。介绍
本项目系统是新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。平台以流程图的方式定义爬虫,是一个高度灵活可配置的爬虫平台。
技术功能
支持Xpath/JsonPath/css选择器/正则提取/混搭提取
支持JSON/XML/二进制格式
支持多数据源、SQL select/selectInt/selectOne/insert/update/delete
支持爬取JS动态渲染(或ajax)的页面
支持代理
支持自动保存至数据库/文件
常用字符串、日期、文件、加解密等函数
支持插件扩展(自定义执行器,自定义方法)
搜索公众号Linux中文社区回复“外卖”,送你一份惊喜礼包。
任务监控,任务日志
支持HTTP接口
支持Cookie自动管理
支持自定义函数
功能演示
爬虫列表
爬虫测试
Debug
日志
扫码下方二维码,后台回复【爬虫】即可获取
免责声明:本文内容来源于网络,文章版权归原作者所有,意在传播相关技术知识&行业趋势,供大家学习交流,若涉及作品版权问题,请联系删除或授权事宜。
技术君个人微信
添加技术君个人微信即送一份惊喜大礼包
→ 技术资料共享
→ 技术交流社群
--END--
往日热文:
Python程序员深度学习的“四大名著”:
这四本书着实很不错!我们都知道现在机器学习、深度学习的资料太多了,面对海量资源,往往陷入到“无从下手”的困惑出境。而且并非所有的书籍都是优质资源,浪费大量的时间是得不偿失的。给大家推荐这几本好书并做简单介绍。
获得方式: